草庐IT

python - 如何优化这个MapReduce函数,Python,mrjob

全部标签

ruby-on-rails - 运行 rake 任务时如何跳过 Rails 初始值设定项的加载?

我的Rails应用程序有一个网站爬虫,它加载爬虫在config/initializers中的Rails初始值设定项中使用的身份验证凭据。初始化程序通过调用SiteLogin模型中的模型方法来加载身份验证。当我运行rakedb:migrate来创建SiteLogin模型表时,它失败了,因为初始化程序期望数据库表已经存在。我可以简单地注释掉初始化程序中的代码,运行迁移以创建表,然后取消注释初始化程序代码,而不用担心这个问题。问题是,我正在使用Capistrano进行部署,这意味着我必须先在没有初始化代码的情况下进行部署以运行迁移,然后再使用初始化代码进行部署。有没有更好的方法来做到这一点,

ruby - 如何将 IO 对象转换为 Ruby 中的字符串?

我正在处理一个IO对象(一些STDOUT输出文本),并且我正在尝试将它转换为一个字符串,以便我可以进行一些文本处理。我想做这样的事情:my_io_object=$stdout#=>#>my_io_object.puts('hi')#note:Iknowhowtomake'hi'intoastring,butthisisasimplifiedexample#=>himy_io_object.to_s我已经尝试了一些东西并得到了一些错误:my_io_object.read#=>IOError:notopenedforreadingmy_io_object.open#=>NoMethodEr

Ruby:如何检查一个字符串是否包含多个项目?

我熟悉Ruby的include?字符串方法,但我如何检查一个字符串的多个内容?具体来说,我需要检查字符串是否包含“Fwd:”或“FW:”(并且应该不区分大小写)示例字符串为:“FWD:您的Amazon.com订单已发货” 最佳答案 the_string=~/fwd:|fw:/i你也可以使用类似的东西%w(fwd:fw:).any?{|str|the_string.downcase.include?str}虽然我个人更喜欢在这种情况下使用正则表达式的版本(特别是因为你必须在第二个中调用downcase以使其不区分大小写)。

ruby - 如何创建 nokogiri 不区分大小写的 Xpath 选择器?

我正在使用nokogiri来选择“关键字”属性,如下所示:putspage.parser.xpath("//meta[@name='keywords']").to_html我正在使用的其中一个页面的关键字标签带有大写字母“K”,这促使我使查询不区分大小写。AND所以,我的问题是:使nokogiri选择不区分大小写的最佳方法是什么?编辑下面Tomalak的建议非常适合这个特定问题。我还想使用这个例子来帮助更好地理解nokogiri,并且有几个我想知道但没有成功搜索的问题。例如,正则表达式“伪类”是NokogiriDocs吗?适合这样的问题吗?我也很好奇nokogiri中的matches?

ruby-on-rails - 如何获取触发查询的代码行?

在rails3.2中是否有一种方法(一个gem、一个插件或其他东西)来知道哪一行代码触发了一个数据库查询?例如在我的日志中我有:UserLoad(0.4ms)SELECT`users`.*FROM`users`WHERE`users`.`id`=5LIMIT1如何知道触发查询的代码行?谢谢... 最佳答案 我找到了这个解决方案:moduleQueryTracedefself.enable!::ActiveRecord::LogSubscriber.send(:include,self)enddefself.append_featur

arrays - 如何通过 & :key as an argument to map instead of a block with ruby?

我写了这段代码:my.objects.map{|object|object.key}我的rubocop说:Pass&:keyasanargumenttomapinsteadofablock.有没有捷径可以做同样的事情? 最佳答案 Pass&:keyasanargumenttomapinsteadofablock意思是:my.objects.map(&:key) 关于arrays-如何通过&:keyasanargumenttomapinsteadofablockwithruby?,我们在S

ruby - 如何对 YAML 文件进行排序?

我一直在尝试使用Ruby对i18n翻译YAML文件进行排序,以便我可以更好、更有条理地管理新翻译,但我一直在想是否有什么方法可以简化这项任务。我找到了一个YAML文件编写器,因此我可以将哈希写入文件,但我的问题是正确排序哈希。如果我得到散列h,h.sort会返回一个数组,但我仍然没有想出一个简单的方法来做到这一点。我有这样的YAML文件:pt-br:global:misc:total:"Total"all:"Todos"close:"Fechar"cancel:"Cancelar"crud:access:"Acessar"back:"Voltar"edit:"Editar"confir

ruby - ruby 是否对所有 x 都有恒等函数,即 x.fn == x?

有时,当我将方法名称作为参数传递时,我发现自己希望使用这样的恒等函数any_obj.send(:identity)==any_obj,所以不要这样:(transform.nil?)?my_obj:my_obj.send(transform)我可以写my_obj.send(transform||:identity)(这是一个有点人为的例子——在更复杂的例子中,身份函数可以做的不仅仅是保存几次击键。)打开Object的定义并添加它会很容易,但是是否已经存在我忽略的东西?还有其他人想要这个吗?P.S.:我知道我的示例确实应该说明any_obj.send(:identity).equal?(a

iphone - 如何从视频中提取方向信息?

在网络上浏览了大量文档后,iPhone似乎总是以480x360的纵横比拍摄视频,并在视频rails上应用变换矩阵。(480x360可能会改变,但对于给定设备而言始终相同)这是一种在iOS项目中修改ffmpeg源代码并访问矩阵http://www.seqoy.com/correct-orientation-for-iphone-recorded-movies-with-ffmpeg/的方法这是在iOS-4中查找转换矩阵的更清晰的方法Howtodetect(iPhoneSDK)ifavideofilewasrecordedinportraitorientation,orlandscape.

ruby - 如何测试使用 mechanize 的 ruby​​ 应用程序

我编写了一个使用Mechanize遍历站点的小程序。我想为它编写测试,但不希望它在我每次运行测试时都实际登录该站点。我想模拟互联网,这样当它访问某个站点时,它只会返回存储的结果。这是一个小例子,假装我的代码的目的是从google主页中提取链接,所以我编写了一个测试以确保我的代码找到的第一个链接包含文本“图像”。我可能会这样写:require'rubygems'require'mechanize'require'test/unit'defmy_code_to_find_linksgoogle=WWW::Mechanize.new.get('http://www.google.com')#